1
Tokenisation et Séquences
EvoClass-AI004Lecture 4
0
🤖
Bip Bop ! Bienvenue, Cadet ! Sélectionnez un sous-thème ci-dessous pour voir comment une IA « lit » grâce à la tokenisation.
Commande de Py-BotEN DIRECT
Bip Bop ! Bonjour, Cadet ! Pour enseigner à une IA à lire, nous devons d'abord découper les mots en petits morceaux « Lego ». Prêt à découvrir comment les ordinateurs transforment les mots en chiffres ?
Progrès du sujet0%
Très bonne choix ! Un token est comme un bloc Lego. Des mots comme « amitié » sont divisés en morceaux plus petits comme « ami » et « bateau ». Même un simple point est un token ! Pour une IA, ces morceaux sont plus faciles à gérer que de longues phrases entières.
1
Sous-thème 1
Qu'est-ce qu'un token ?
Découper le texte en petites unités comme « ami » et « bateau ».
Regardez ça ! Dès que nous avons des tokens, l'IA attribue à chacun un numéro d'identification secret. Ces chiffres forment une « séquence ». Souvenez-vous : l'ordre compte ! « Le chien a mordu l'homme » et « L'homme a mordu le chien » utilisent les mêmes blocs, mais la séquence raconte une histoire totalement différente !
2
Sous-thème 2
La puissance des séquences
Transformer des blocs en une liste mathématique où l'ordre est tout.
Saviez-vous que l'IA dispose d'une « fenêtre de contexte », qui est comme sa taille de main. Elle ne peut tenir qu'un certain nombre de tokens dans sa « mémoire » à la fois avant de commencer à oublier le début !
Saviez-vous ?
L'IA dispose d'une « fenêtre de contexte », qui est comme sa taille de main. Elle ne peut tenir qu'un certain nombre de tokens dans sa « mémoire » à la fois avant de commencer à oublier le début !
Chargement...
⭐⭐⭐
Mission terminée !
Vous êtes un maître des tokens !